首页  资讯  商机   下载  拆解   高校  招聘   杂志  会展  EETV  百科   问答  电路图  工程师手册   Datasheet  100例   活动中心  E周刊阅读   样片申请
EEPW首页 >> 主题列表 >> 多模态 llm

多模态 llm 文章 最新资讯

打破 AI 内存墙:Majestic Labs 推 128TB 内存服务器 Prometheus

  • 内存,可以说是当前制约人工智能大语言模型(LLM)性能的最大瓶颈。一篇业内极具影响力的论文指出,大语言模型的词元生成任务本质上受限于内存性能,模型的文本生成速度完全取决于内存的数据读取速率。并且,这一瓶颈的制约力度会随着模型参数量的增大而持续加剧,最终形成阻碍大模型推理性能提升的内存墙。针对这一行业难题,AI硬件初创企业Majestic Labs推出了一套直接且全面的解决方案。该公司自研全新AI服务器Prometheus,最大内存容量可达128TB,相较于英伟达旗舰级AI处理机架DGX B300,内存容量
  • 关键字: 服务器   人工智能加速器   内存墙   LLM  

Meta推出Muse Spark多模态推理模型

  • Meta 平台公司今日推出了一款全新的推理模型Muse Spark,该模型在解答健康问题与分析多模态数据方面表现极为出色。未来几周内,Meta 将把该算法接入面向消费者的Meta AI人工智能服务中。此外,Meta 还将通过应用程序编程接口(API)向开发者开放 Muse Spark,目前该 API 处于非公开预览阶段。Meta 表示,Muse Spark 在多项基准测试中超越了 Claude 4.6 Opus、Gemini 3.1 Pro 与 GPT 5.4。其中一项测试为HealthBench Har
  • 关键字: Meta   Muse Spark   多模态   推理模型  

大语言模型生成的测试平台可编译却无法完成验证?解密验证鸿沟问题

  • 所有验证工程师都深有体会的难题:你让大语言模型(LLM)生成一个 UVM 测试平台,它输出了 25 个文件,所有文件均可正常编译。可运行仿真后却毫无反应 —— 计分板显示零校验结果,从机驱动程序处理 10 笔事务后便停止运行,仿真直接卡死。这并非假设场景。在一项对照实验中,研究人员使用当前主流的商用大语言模型为 AHB2APB 桥设计生成 UVM 测试平台,即便经过自动化智能修复循环、分 4 次迭代解决了 37 个编译错误,最终还是出现了上述问题。问题核心在于:编译成功与协议层的功能正确性几乎无关,但在硬
  • 关键字: 大语言模型   测试平台   编译   验证   验证鸿沟   LLM   芯粒  

人工智能模型在一个简单的任务上表现惨败:计时

  • 人工智能能力的快速发展让许多人感到担忧。但别太担心:如果你能正确读出模拟钟表,在这方面你仍然领先于人工智能。能够分析文本、图像和视频等不同类型媒体的人工智能模型——被称为多模态大型语言模型(MLLM),正在体育分析和自动驾驶等多个应用领域获得广泛关注。但有时,这些模型在看似最简单的任务上也会失败,比如准确读取模拟钟的时间。这就引发了一个问题:这些模型到底在哪些图像分析方面遇到了困难?例如,在阅读传统钟表时,模型是否难以区分短指针和长指针?或者难以准确定位手的角度和方向,相对于数字?这些看似琐碎的问题的答案
  • 关键字: 人工智能   多模态  

产品中的大型语言模型:实用实地指南

  • 用大型语言模型构建让我明白了一个明确的道理:最好的AI功能往往是隐形的。当它成功时,用户不会停下来想“那是人工智能”。他们只需点击一个按钮,快速得到回复,然后继续他们的任务。当它不奏效时,你会立刻注意到:转盘花的时间太长,或者答案听起来自信但其实不是真的。我多次遇到这两堵墙。每次修复都不是关于“更智能的AI”,而是关于谨慎的工程选择。只使用你需要的上下文。要求有结构化的产出。当准确性重要时,保持低随机性。让系统说“我不知道”。本指南不涉及大型研究理念。它讲述的是任何工程师都可以遵循的实际步骤,将开源的大型
  • 关键字: AI   LLM  

加速FPGA上的LLM推理

  • 实现FPGA加速LLM性能Speedster7t FPGA 在运行 Llama2 70B 参数模型时,与 GPU 解决方案相比表现如何?证据令人信服——Achronix Speedster7t FPGA 在处理大型语言模型(LLM)方面表现优异,通过提供计算能力、内存带宽和卓越能效的最佳组合——这些是当今大型语言模型复杂需求的关键特质。像Llama2这样的大型语言模型的快速发展,为自然语言处理(NLP)开辟了一条新的道路,有望带来比以往任何时候都更接近人类的互动和理解。这些复杂的大型语言模型是创新的催化剂
  • 关键字: FPGA   LLM  

集成人工智能聊天机器人的信息娱乐系统

  • Cerence声称其人工智能驱动的对话式语音助手技术已向全球80多家汽车制造商和一级供应商提供服务。Cerence xUI在今年慕尼黑IAA Mobility 2025展会上向WardsAuto展示了其AI语音辅助如何直观地与用户对话。 许可由CerenceAI FAB电影广告品牌授权与机器人助手对话过去只是《钢铁侠》电影中的一个场景,但现在许多现代汽车都配备了由语音服务专家Cerence提供的功能。该公司声称其AI驱动的对话语音助手已向全球80多家汽车制造商和一级供应商提供服务,约有5.25亿辆汽车上路
  • 关键字: Cerence AI 语音助手   车载 AI   汽车 LLM 交互  

中国的一台机器人刚刚在三天内走了66英里——创造了新的世界纪录

  • 在小说及同名电影《阿甘正传》中,主角阿甘连续跑了三年多,足迹遍布美国,总里程约达 15000 英里。对于大多数人而言,这样的成就遥不可及,但一款名为 AgiBot A2 的机器人近日也完成了一段意义非凡的长途行走挑战。这款机器人仅用三天时间就走完了 66 英里,创下了一项新纪录。若给予它和阿甘同等时长,其行走里程有望突破 24000 英里。何为 AgiBot A2?AgiBot(即智远机器人公司)于 2023 年在中国上海成立,初衷是为同名初代双足机器人的推出提供支持。此后几年间,该公司对其旗舰机型持续迭
  • 关键字: 机器人   双足机器人   多模态   人工智能  

让机器人更聪明:LLM 驱动的“智能体计算”走到哪一步了?

  • 摘要过去几年,机器人技术突飞猛进,但“理解人类意图、在非结构化环境中稳健执行”的核心能力仍显不足。大型语言模型(LLM)被视为潜在的“语义大脑”,可将开放式自然语言映射为可执行的多步计划,并在执行中进行自检与纠错,从而提升机器人在家庭、医疗与工业场景中的可用性。本文系统梳理 LLM+机器人(下称 LLM-Robo)的最新工程思路、关键挑战与代表性数据:能力侧:从“代码式精确指令”转向“语言式开放交互”,支持迭代计划与上下文感知。工程侧:集成 LLM、控制系统与多模态传感的完整链路仍复杂,涉及语义落地(gr
  • 关键字: 机器人,LLM  

新突思推出下一代Astra™多模态GenAI处理器,赋能智能物联网边缘的未来

  • 新突思公司(Synaptics® Incorporated)近日宣布推出全新的Astra™ SL2600系列多模态边缘人工智能(Edge AI) 处理器,旨在提供卓越的性能和能效。Astra SL2600系列将赋能新一代经济高效的智能设备,让认知物联网(IoT)成为现实。SL2600系列将与SL2610产品线一起推出,包含五个针对不同Edge AI应用的处理器系列。这些处理器专为打造下一波智能家电、家居和工厂自动化设备、充电基础设施、医疗设备、零售销售点终端和扫描仪、自主机器人系统、无人机(UAV)、休闲
  • 关键字: 新突思   Synaptics   多模态   GenAI处理器  

6TOPS算力驱动30亿参数LLM,米尔RK3576部署端侧多模态多轮对话

  • 当 GPT-4o 用毫秒级响应处理图文混合指令、Gemini-1.5-Pro 以百万 token 上下文 “消化” 长文档时,行业的目光正从云端算力竞赛转向一个更实际的命题:如何让智能 “落地”?—— 摆脱网络依赖、保护本地隐私、控制硬件成本,让设备真正具备 “看见并对话” 的离线智能,成为边缘 AI 突破的核心卡点。2024 年,随着边缘 SoC 算力正式迈入 6 TOPS 门槛,瑞芯微 RK3576 给出了首个可量产的答案:一套完整的多模态交互对话解决方案。RK3576多模态纯文字:自我介绍如今,“端
  • 关键字: 瑞芯微 RK3576   NPU(神经网络处理器)   端侧小语言模型(SLM)   多模态 LLM   边缘AI部署   开发板  

Qwen2-VL-3B模型在米尔瑞芯微RK3576开发板NPU多模态部署指导与评测

  • 随着大语言模型(LLM)技术的快速迭代,从云端集中式部署到端侧分布式运行的趋势日益明显。端侧小型语言模型(SLM)凭借低延迟、高隐私性和离线可用的独特优势,正在智能设备、边缘计算等场景中展现出巨大潜力。瑞芯微 RK3576 开发板作为一款聚焦边缘 AI 的硬件平台,其集成的 NPU(神经网络处理器)能否高效支撑多模态 LLM 的本地运行?性能表现如何? RK3576 多模态纯文字:爱因斯坦有什么贡献RK3576 多模态纯文字:自我介绍本文将围绕这一核心问题展开 —— 从端侧 SLM 与云端 LL
  • 关键字: 瑞芯微   RK3576   NPU      端侧小语言模型   SLM   多模态   LLM  

EDA开发流程中的多模态AI

  • RTL 编码是半导体开发的关键步骤,但许多人认为这并不是最困难的一步。随着您越来越接近实施,并且系统上下文变得比仅通过文本可以理解的要大,事情会变得更加复杂。在这两种情况下,布局、时间、功率和许多其他因素都会发挥作用,但没有一个是文本更容易表示的,而且它们不遵循相同的规则。正如流行的格言所说,“一张图片胜过千言万语”,这可能是非常保守的。框图、时序图、波形、状态图、流程图、平面图、布局、热图——用作输入和输出的图形形式列表非常广泛。人工智能需要能够理解并生成它们。这句格言也可以从另一个角度看待。图片以及所
  • 关键字: EDA   多模态   AI  

Gartner:到2030年,80%企业软件和应用将为多模态,2024年尚不足10%

  • Gartner预测,到2030年,多模态企业软件和应用将占比达80%,远高于2024年不到10%的水平。Gartner高级研究总监Roberta Cozza表示:“企业软件向多模态转变是一次企业运营和创新的根本转型。多模态生成式人工智能(GenAI)将带来此前无法实现的特性和功能,推动企业应用的升级演进,医疗、金融、制造等行业都将从中受益。该技术将通过增强特定领域语言模型,提高模型准确性,实现企业运营的自动化并驱动情境决策智能,使AI能够在各种任务中主动采取行动。”多模态GenAI模型等具有重大影响力的技
  • 关键字: Gartner   多模态  

数据中心互连技术,第三种选择

LLM真的具有商业价值吗?

  • 如果您曾经参加过企业性格或技能评估,您可能遇到过 Core Values Finder,这是一种衡量个人价值观的工具。它基于评估人类价值观的最可靠和有效的工具之一:肖像价值观问卷修订版 (PVQ-RR)。科学问卷的目标是评估受访者如何与 20 种不同的价值观保持一致,其中包括关怀、宽容、谦逊、成就和自我指导。受访者使用 1(“最不像我”)到 6(“最像我”)的等级进行排名。他们的回答表明了什么对他们来说很重要,以及什么影响了他们如何做出决策。我和我在 AI Alt Lab 的团队研究
  • 关键字: LLM   Google   Meta   OpenAI  

在LLM方面Google取得成功,而Meta和OpenAI则跌跌撞撞

  • 大型语言模型 (LLM) 的早期历史由 OpenAI 主导,在较小程度上由 Meta 主导。OpenAI 的早期 GPT 模型确立了 LLM 性能的前沿,而 Meta 则通过提供强大性能的开放权重模型开辟了一个健康的利基市场。开放权重模型具有可公开访问的代码,任何人都可以自由使用、修改和部署这些代码。这使得包括谷歌在内的一些科技巨头落后了。2017 年,谷歌发表了一篇关于支撑大型语言模型的 transformer 架构的突破性研究论文,但该公司往往因其在
  • 关键字: LLM   Google   Meta   OpenAI  

大语言模型通过图灵测试:GPT4.5比人还像人

  • 美国加州大学圣地亚哥分校(UCSD)发布了一项研究成果,宣称首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”,证明大语言模型(LLM)通过了图灵测试。其中,GPT-4.5被判断为人类的比例高达73%,显著高于真实人类参与者被选中的比例。图灵测试由英国数学家和计算机科学家Alan Turing于1950年提出,他称之为“模仿游戏”。图灵设想,如果一名提问者在通过文本交流时无法区分对方是机器还是人类,那么这个机器可能具备类似人类的智能。在三方图灵测试中,提问者需与一名人类和一台机器进行对话,并准确
  • 关键字: 大模型   图灵测试   AI   GPT   LLaMa   LLM  

如何使用LLM建立行业KG(知识图)

  • 1   KG与LLM完美结合大语言模型(LLM)在各种应用领域中已经取得了显着的成功,但是它常常无法捕捉和掌握最新的事实知识。而另一方面,知识图(Knowledge Graph,简称:KG)则拥有丰富的专家知识和事实知识,但它很难以构建,又又不足以处理现实世界知识图谱的动态变化性质和因果推论功能等。因此,自然而然地将KG 和LLM结合起来,各自发挥优势,相辅相成,缔造完美组合。2   KG协助LLM:降低LLM幻觉大家都知道,LLM 常有幻觉(Hallucinati
  • 关键字: 202503   LLM   行业KG   知识图  

Arm与阿里巴巴合作,KleidiAI与通义千问模型集成

  • Arm 控股有限公司(以下简称 “Arm”)今日发布与阿里巴巴淘天集团轻量级深度学习框架 MNN 的又一新合作。双方经由 Arm KleidiAI 的集成,成功让多模态人工智能 (AI) 工作负载通过阿里巴巴经指令调整的通义千问 Qwen2-VL-2B-Instruct 模型运行在搭载 Arm CPU 的移动设备上。该版本的通义千问模型专为端侧设备的图像理解、文本到图像的推理,以及跨多种
  • 关键字: Arm   阿里巴巴   KleidiAI   通义千问   多模态  

GPT-4.5发布:比GPT-4提升10倍 但"并非前沿模型"

  • 2月28日消息,美国时间周四,OpenAI宣布推出GPT-4.5,这是其最新、最强大的大语言模型(LLM)的研究预览版,专为聊天应用设计。不过,这也是OpenAI迄今为止最昂贵的模型。不过,GPT-4.5仍然是一款传统的大型语言模型,而非“推理模型”。此前,OpenAI、DeepSeek、Anthropic等公司都推出了推理模型,这些模型能够生成“思维链”或类似意识流的文本,通过反思自身的假设和结论,尝试在向用户提供响应或输出之前捕捉错误。尽管如此,OpenAI联合创始人兼首席执行官山姆·奥特曼(Sam
  • 关键字: GPT-4.5   GPT-4   OpenAI   LLM  

多模态人工智能有哪些应用场景?

  • 上一篇文章介绍了什么是生成式人工智能(Generative AI)(https://www.eepw.com.cn/article/202502/467350.htm)。本篇为您介绍与生成式人工智能有关系的多模态人工智能如何实现像人一样综合处理多个信息和数据,以及多模态人工智能有哪些常见应用场景。01 生成式AI与多模态AI人工智能技术正在迅速发展,不断改变我们的生活和业务等的存在方式。在这些人工智能技术中,目前特别受到关注的人工智能有“生成式人工智能”和“多模态人工智能”。生成式人工智能是一种拥有能够自
  • 关键字: 人工智能   多模态  

Arm KleidiAI 助力提升 PyTorch 上 LLM 推理性能

  • 作者:Arm 基础设施事业部软件工程师 Nobel Chowdary Mandepudi生成式人工智能 (AI) 正在科技领域发挥关键作用,许多企业已经开始将大语言模型 (LLM) 集成到云端和边缘侧的应用中。生成式 AI 的引入也使得许多框架和库得以发展。其中,PyTorch 作为热门的深度学习框架尤为突出,许多企业均会选择其作为开发 AI 应用的库。通过部署 Arm Kleidi 技术 ,Arm 正在努力优化 PyTorch,以加速在基于 Arm 架构的处理器上运行 LLM 的性能
  • 关键字: Arm   KleidiAI   PyTorch   LLM  

研华本地大型语言模型(LLM)边缘AI服务器AIR-520

  • 工业物联网领域的全球供应商研华科技近日公布,其自主研发的“AIR-520本地大型语言模型(LLM)边缘AI服务器”荣获“第33届台湾精品奖”银奖!今年,研华有六款产品获得了中国台湾精品奖,其中两款获得了享有盛誉的银奖。这一出色的成绩凸显了业界对研华智能系统和嵌入式平台在工业物联网领域的认可。研华表示将继续整合人工智能驱动的行业解决方案和领域专业知识,加速数字化转型,为客户推动工业智能的发展。研华嵌入式物联网集团总经理张家豪强调,研华作为一家跨越边缘计算、物联网系统软件和垂直行业解决方案的多元化工业物联网企
  • 关键字: 研华   本地大型语言模型   LLM   边缘AI服务器  

AI大模型迈向多模态,助力具身智能与机器人实现创新

  • 你听过莫拉维克悖论 (Moravec's paradox) 吗?该悖论指出,对于人工智能 (AI) 系统而言,高级推理只需非常少的计算能力,而实现人类习以为常的感知运动技能却需要耗费巨大的计算资源。实质上,与人类本能可以完成的基本感官任务相比,复杂的逻辑任务对 AI 而言更加容易。这一悖论凸显了现阶段的 AI 与人类认知能力之间的差异。人本来就是多模态的。我们每个人就像一个智能终端,通常需要去学校上课接受学识熏陶(训练
  • 关键字: 202411   AI大模型   多模态   具身智能   机器人  

Arm计算平台加持,全新Llama 3.2 LLM实现AI 推理的全面加速和扩展

  • 新闻重点:●   在Arm CPU上运行Meta最新Llama 3.2版本,其云端到边缘侧的性能均得到显著提升,这为未来AI工作负载提供了强大支持●   Meta与Arm的合作加快了用例的创新速度,例如个性化的端侧推荐以及日常任务自动化等●   Arm十年来始终积极投资AI领域,并广泛开展开源合作,为 1B 至 90B 的 LLM 实现在 Arm 计算平台上无缝运行人
  • 关键字: Arm   Llama 3.2 LLM   AI 推理   Meta  

传感器融合技术如何助力自主移动机器人导航再升级?

  • 自主移动机器人(AMR)可帮助制造商提高生产效率、增强安全性并节省大量成本,因而在各行各业得到广泛应用。2022年全球AMR市场规模为86.5亿美元,预计2022年至2028年间的复合年增长率(CAGR)将达到18.3%。进入工业5.0时代,人类将与人工智能(AI)机器人协同工作,机器人辅助而非取代人类。愿景固然美好,但要实现这一目标,AMR必须克服重重挑战,集成各种传感器以及新兴的传感器融合技术将为此提供助益。AMR采用过程中所面临的挑战AMR普及的一大难题是其在多种不同应用和环境中的适应性。AMR已广
  • 关键字: 自主移动机器人   传感器   AMR   LLM  

用工具弥补AI短板,让AI答案更精准

  • ChatGPT和GPT-4等大型语言模型 (LLM) 已成为提高工作效率和更好地理解各种主题不可或缺的工具。从教育到软件开发,再到内容写作,LLM在众多领域崭露头角,它们在提炼和生成供人类使用的信息方面有着近乎神奇的能力。不过,尽管LLM的能力令人印象深刻,但它们在提供准确答案或执行需要精确知识的特定任务时,却常常比较吃力。例如,对于复杂的数学问题或者晦涩难懂的题目,往往会给出错误或不够充分的答案。出现这些局限性的主要原因是,LLM通常是使用过时的数据进行训练,以预测句子中下一个在统计
  • 关键字: 语言模型   LLM   AI  

Nvidia 征服了最新的 AI 测试

  • 多年来,英伟达在许多机器学习基准测试中占据主导地位,现在它又多了两个档次。MLPerf,有时被称为“机器学习的奥林匹克”的人工智能基准测试套件,已经发布了一套新的训练测试,以帮助在竞争计算机系统之间进行更多更好的同类比较。MLPerf 的一项新测试涉及对大型语言模型的微调,该过程采用现有的训练模型,并用专业知识对其进行更多训练,使其适合特定目的。另一个是图神经网络,一种机器学习,一些文献数据库背后的一种机器学习,金融系统中的欺诈检测,以及社交网络。即使使用谷歌和英特尔的人工智能加速器的计算机增加和参与,由
  • 关键字: GPU   神经网络   LLM   MLPerf   基准测试   英伟达  

中国电信发布全球首个单体稠密万亿参数语义模型 Tele-FLM-1T

  • IT之家 6 月 19 日消息,中国电信人工智能研究院(TeleAI)和智源研究院联合发布全球首个单体稠密万亿参数语义模型 Tele-FLM-1T,该模型与百亿级的 52B 版本,千亿级的 102B 版本共同构成 Tele-FLM 系列模型。TeleAI 和智源研究院基于模型生长和损失预测等技术,Tele-FLM 系列模型仅使用了业界普通训练方案 9% 的算力资源,基于 112 台 A800 服务器,用 4 个月完成 3 个模型总计 2.3T tokens 的训练。模型训练全程做到了零调整零重试
  • 关键字: LLM   AI   大语言模型  

多模态 llm介绍

您好,目前还没有人创建词条多模态 llm!
欢迎您创建该词条,阐述对多模态 llm的理解,并与今后在此搜索多模态 llm的朋友们分享。    创建词条

热门主题

树莓派    linux   
关于我们 - 广告服务 - 企业会员服务 - 网站地图 - 联系我们 - 征稿 - 友情链接 - 手机EEPW
Copyright ©2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《电子产品世界》杂志社 版权所有 北京东晓国际技术信息咨询有限公司
备案 京ICP备12027778号-2 北京市公安局备案:1101082052    京公网安备11010802012473